在这项研究中,开发了一种机器学习模型,用于自动检测呼吸系统声音,例如在疾病诊断中进行打喷嚏和咳嗽。自动模型和探讨呼吸声的发展,携带有价值的信息,导致早期诊断和治疗。本研究开发了一个成功的机器学习模型,这是对挑战的强烈反应,称为“OSFHOME”开放式接入平台上的“辉瑞数字医学挑战”。 “环境声音分类”称为ESC-50和Audioset Sound文件用于准备数据集。在该数据集中由三个部分组成,从训练,测试和验证样品中提取有效地显示咳嗽和打喷嚏声音分析的功能。基于MEL频率谱系齐系数(MFCC)特征提取方法,准备了数学和统计特征。考虑了三种不同的分类技术在包含超过3800个不同的声音的数据集中执行成功的呼吸声分类。支持向量机(SVM)具有径向基函数(RBF)内核,集合聚合和决策树分类方法用作分类技术。为了尝试将咳嗽和打喷嚏来自其他声音的声音,SVM与RBF内核的成功取得了83%。
translated by 谷歌翻译
Current Virtual Reality (VR) environments lack the rich haptic signals that humans experience during real-life interactions, such as the sensation of texture during lateral movement on a surface. Adding realistic haptic textures to VR environments requires a model that generalizes to variations of a user's interaction and to the wide variety of existing textures in the world. Current methodologies for haptic texture rendering exist, but they usually develop one model per texture, resulting in low scalability. We present a deep learning-based action-conditional model for haptic texture rendering and evaluate its perceptual performance in rendering realistic texture vibrations through a multi part human user study. This model is unified over all materials and uses data from a vision-based tactile sensor (GelSight) to render the appropriate surface conditioned on the user's action in real time. For rendering texture, we use a high-bandwidth vibrotactile transducer attached to a 3D Systems Touch device. The result of our user study shows that our learning-based method creates high-frequency texture renderings with comparable or better quality than state-of-the-art methods without the need for learning a separate model per texture. Furthermore, we show that the method is capable of rendering previously unseen textures using a single GelSight image of their surface.
translated by 谷歌翻译
当应用于自动驾驶汽车设置时,行动识别可以帮助丰富环境模型对世界的理解并改善未来行动的计划。为了改善自动驾驶汽车决策,我们在这项工作中提出了一种新型的两阶段在线行动识别系统,称为RADAC。RADAC提出了主动剂检测的问题,并在直接的两阶段管道中以进行动作检测和分类的直接识别人类活动识别中的参与者关系的想法。我们表明,我们提出的计划可以胜过ICCV2021 ROAD挑战数据集上的基线,并通过将其部署在真实的车辆平台上,我们演示了对环境中代理行动的高阶理解如何可以改善对真实自动驾驶汽车的决策。
translated by 谷歌翻译
计算机视觉和机器学习的进步使机器人能够以强大的新方式感知其周围环境,但是这些感知模块具有众所周知的脆弱性。我们考虑了合成尽管有知觉错误的安全控制器的问题。所提出的方法基于具有输入依赖性噪声的高斯过程构建状态估计器。该估计器为给定状态计算实际状态的高信心集。然后,合成了可证明可以处理状态不确定性的强大神经网络控制器。此外,提出了一种自适应采样算法来共同改善估计器和控制器。模拟实验,包括Carla中基于逼真的巷道示例,说明了提出方法在与基于深度学习的感知合成强大控制器中提出的方法的希望。
translated by 谷歌翻译
基于深度学习的图生成方法具有显着的图形数据建模能力,从而使它们能够解决广泛的现实世界问题。使这些方法能够在生成过程中考虑不同的条件,甚至通过授权它们生成满足所需标准的新图形样本来提高其有效性。本文提出了一种条件深图生成方法,称为SCGG,该方法考虑了特定类型的结构条件。具体而言,我们提出的SCGG模型采用初始子图,并自动重新收获在给定条件子结构之上生成新节点及其相应的边缘。 SCGG的体系结构由图表表示网络和自动回归生成模型组成,该模型是端到端训练的。使用此模型,我们可以解决图形完成,这是恢复缺失的节点及其相关的部分观察图的猖and固有的困难问题。合成数据集和现实世界数据集的实验结果证明了我们方法的优势与最先进的基准相比。
translated by 谷歌翻译
历史上,轨迹计划和控制已分为自动驾驶堆栈中的两个模块。轨迹计划的重点是更高级别的任务,例如避免障碍物并保持在路面上,而控制器则尽最大努力遵循有史以来不断变化的参考轨迹。我们认为,由于计划中的轨迹与控制器可以执行的内容不匹配,因此这种分离是有缺陷的,并且(2)由于模型预测性控制(MPC)范式的灵活性而不必要。取而代之的是,在本文中,我们提出了一个基于统一的MPC轨迹计划和控制计划,该计划可确保在道路边界,静态和动态环境方面的可行性,并实施乘客舒适性限制。在各种方案中,对该方案进行了严格的评估,这些方案旨在证明最佳控制问题(OCP)设计和实时解决方案方法的有效性。原型代码将在https://github.com/watonomous/control上发布。
translated by 谷歌翻译
心电图(ECG)是用于监测心脏电信号和评估其功能的最常见和常规诊断工具。人心脏可能患有多种疾病,包括心律不齐。心律不齐是一种不规则的心律,在严重的情况下会导致心脏中风,可以通过ECG记录诊断。由于早期发现心律不齐非常重要,因此在过去的几十年中,计算机化和自动化的分类以及这些异常心脏信号的识别引起了很多关注。方法:本文引入了一种轻度的深度学习方法,以高精度检测8种不同的心律不齐和正常节奏。为了利用深度学习方法,将重新采样和基线徘徊清除技术应用于ECG信号。在这项研究中,将500个样本ECG段用作模型输入。节奏分类是通过11层网络以端到端方式完成的,而无需手工制作的手动功能提取。结果:为了评估提出的技术,从两个Physionet数据库,MIT-BIH心律失常数据库和长期AF数据库中选择了ECG信号。基于卷积神经网络(CNN)和长期记忆(LSTM)的组合,提出的深度学习框架比大多数最先进的方法显示出令人鼓舞的结果。所提出的方法达到98.24%的平均诊断准确性。结论:成功开发和测试了使用多种心电图信号的心律失常分类的训练有素的模型。意义:由于本工作使用具有高诊断精度的光分类技术与其他值得注意的方法相比,因此可以在Holter Monitor设备中成功实施以进行心律失常检测。
translated by 谷歌翻译
冲浪是世界许多地方桥梁故障的第一大原因。考虑到现有的经验方程缺乏冲洗深度估计的可靠性以及作为物理现象的复杂性和不确定性的复杂性和不确定性,因此必须开发更可靠的解决方案来进行冲洗风险评估。这项研究介绍了一种新型的AI方法,以根据从Sonar和安装在桥墩上的舞台传感器获得的实时监视数据进行早期预测。长期术语记忆网络(LSTMS)是一种成功用于其他领域预测时间序列的突出的深度学习算法,是使用河流和床位高程读数开发和培训了从阿拉斯加冲洗监测计划获得的11年以上。三个案例研究桥梁显示了AI模型在SCOUR预测中的能力。结果表明,LSTM可以通过冲刷和填充周期来捕获桥墩周围的流动和河床变化的时间和季节性模式,并可以在提前7天之前提供对即将到来的Scour深度的合理预测。预计拟议的解决方案可以由运输部门实施,用于开发新兴的基于AI的预警系统,从而实现高级桥梁冲洗管理。
translated by 谷歌翻译
我们研究了基于消费者的决策积极学习非参数选择模型的问题。我们提出一个负面结果,表明这种选择模型可能无法识别。为了克服可识别性问题,我们介绍了选择模型的有向无环图(DAG)表示,从某种意义上说,该模型可以捕获有关选择模型的更多信息,从而可以从理论上识别信息。然后,我们考虑在主动学习环境中学习与此DAG表示的近似的问题。我们设计了一种有效的主动学习算法,以估计非参数选择模型的DAG表示,该模型在多项式时间内运行时,当随机均匀地绘制频繁排名。我们的算法通过主动和反复提供各种项目并观察所选项目来了解最受欢迎的频繁偏好项目的分布。我们表明,与相应的非活动学习估计算法相比,我们的算法可以更好地恢复有关消费者偏好的合成和公开数据集的一组频繁偏好。这证明了我们的算法和主动学习方法的价值。
translated by 谷歌翻译
白内障手术中的语义分割具有广泛的应用,可导致外科结果增强和降低临床风险。但是,在这些手术中分割不同相关结构的不同问题使得指定独特的网络非常具有挑战性。本文提出了一个语义分割网络,称为Deeppyramid,可以使用三个新颖性来应对这些挑战:(1)金字塔视图融合模块,该模块可在输入卷积中每个像素位置的周围区域中提供不同的角度的全球视图功能图; (2)一个可变形的金字塔接收模块,该模块可实现一个可适应感兴趣对象的几何变换的广泛可变形接收场; (3)专用的金字塔损失,可自适应监督多尺度语义特征图。结合在一起,我们表明这些模块可以有效地提高语义分割性能,尤其是在对象中透明度,可变形性,可伸缩性和钝边缘的情况下。我们证明我们的方法在最先进的级别上执行,并且优于许多现有方法,其利润率很高(与最佳竞争对手的方法相比,联合的交叉路口总体改善为3.66%)。
translated by 谷歌翻译